# config.py

# 环境参数
NUM_TARGETS = 6           # 目标数量
FREQ_RANGE = (200, 400)   # 频率范围 (MHz)
MAX_JAM_BANDWIDTH = 3     # 最大干扰带宽 (MHz)
MIN_JAM_BANDWIDTH = 1     # 最小干扰带宽 (MHz)
BANDWIDTH_STEPS = 11      # 可选带宽步长数（1-3 MHz，每隔0.2 MHz）

# 模型参数
INPUT_DIM_FREQ = 10       # 干扰频段决策器输入维度
INPUT_DIM_BAND = 16       # 干扰带宽决策器输入维度
HIDDEN_DIM_FREQ = 30      # 干扰频段决策器隐藏层维度
HIDDEN_DIM_BAND = 16      # 干扰带宽决策器隐藏层维度
ACTION_SPACE_FREQ = 10    # 干扰频段动作空间大小
ACTION_SPACE_BAND = 11    # 干扰带宽动作空间大小

# 训练参数
LEARNING_RATE = 1e-4      # 学习率
GAMMA = 0.99              # 折扣因子
EPSILON = 0.1             # ε-greedy 探索概率
BATCH_SIZE = 64           # 批次大小
MAX_EPISODES = 10000      # 最大训练回合数
TARGET_UPDATE_FREQ = 100  # 目标网络更新频率

# BETMR 参数
THRESHOLD_SET = [0, 50, 100, 150]  # 动态阈值集
SAMPLE_RATIO = 0.8         # 正常经验池采样比例